import pandas as pd
import os

def process_csv(input_path):
    # 获取文件夹和原始文件名
    folder, filename = os.path.split(input_path)
    name, ext = os.path.splitext(filename)

    # 读取文件（自动去掉空白行）
    df = pd.read_csv(input_path, header=None)

    # 保留第三列（索引为2），并重置索引
    if df.shape[1] < 3:
        print("原文件列数少于3列，无法提取第三列。")
        return

    col_data = df.iloc[:, 2].dropna().astype(str)  # 提取第三列并转为字符串处理

    # 删除包含 'Error' 的行
    col_data = col_data[~col_data.str.contains("Error", case=False, na=False)]

    # 删除空字符串或纯空格的行，并重置索引
    col_data = col_data[col_data.str.strip() != ""].reset_index(drop=True)

    # 获取剩余数据量
    count = len(col_data)

    # 构造输出文件名（在.csv前加 put 并加上数据量）
    new_filename = f"{name}_put_{count}.csv"
    output_path = os.path.join(folder, new_filename)

    # 保存到新文件
    col_data.to_csv(output_path, index=False, header=False, encoding='utf-8-sig')
    print(f"已保存文件到: {output_path}，共 {count} 条数据。")

# 示例调用
process_csv(r"E:\trae\translate\4_河东区_output.csv")
